Quiz 5.mars. Multippel og logistisk regresjon

Vi jobber videre med stressdata fila fra slides som er hentet fra denne studien

  1. Er dette et tverrsnitts- eller longitudinelt datasett?

  2. Er utvalget tilfeldig? Hvordan vil du karakterisere utvalget?

  3. Hva er standardavviket til alder i datasettet?

  4. Hvordan vil du definere en “uvanlig” høy alder?

  5. Lag et 95\% konfidensintervall for alder.

t.test(stressdata$age)
  1. Det påstås at i populasjonen som dette utvalget er tatt ifra så er menn og kvinner like gamle. Skriv opp nullhypotesen og alternativhypotesen. Bruk symbolene \(\mu_M\) og \(\mu_K\).

  2. Utfør testen ved hjelp av

t.test(age~kjønn, stressdata)
  1. Gå til artikkelen og last ned “supplemental data” dokumentet. Der finner du spørsmålene om Usikkerhet: INSE1-INSE5. Lag et spredningsplott av INSE1 vs INSE2 og forklar hvorfor det ikke er informativt
plot(stressdata$INSE1, stressdata$INSE2)
  1. Du kan “jittre” observasjonene ved hjelp av ggplot2 pakken i tidyverset.
qplot(stressdata$INSE1, stressdata$INSE2)+geom_jitter()

Legg til regresjonslinja ved hjelp av +geom_smooth(method=“lm”) i kommandoen over. Er det negativ, ingen, eller positiv sammenheng mellom INSE1 og INSE2?

  1. Beregn korrelasjonen mellom INSE1 og INSE2 vha cor() funksjonen

  2. Lag summescore for alle 5 INSE items, som en ny variabel:

stressdata$insecurity <- stressdata$INSE1+stressdata$INSE2+stressdata$INSE3+stressdata$INSE4+stressdata$INSE5
  1. Kjør en regresjon med summescore for insecurity som avhengig variabel og kjønn og alder som prediktorer. Hva blir \(R^2\) adjusted?
mod <- lm(insecurity ~ kjønn+age, data=stressdata) 
summary(mod)

Har modellen noen som helst forklaringskraft?

  1. Kjør en regresjon med summescore for insecurity som avhengig variabel og bransje som prediktor. Har denne modellen noen som helst forklaringskraft?
mod <- lm(insecurity ~ bransje, data=stressdata) 
summary(mod)

Har modellen noen som helst forklaringskraft?

  1. Tolk Intercept verdien i modellen i oppgave 12.

  2. Tolk regresjonskoeffisient for bransje:Helse og Omsorg, i oppgave 12.

  3. Ta med summescoren complexity for COMP1-COMP5 som en prediktor i tillegg til bransje. Har denne modellen bedre forklaringskraft enn modellen i oppgave 12?

  4. Tolk regresjonskoeffisienten til complexity.

  5. Hvilken insecurity score forventer vi for en person som skåret 10 på complexity skalaen dersom denne personen jobber i Helse og omsorg?

  6. Lag korrelasjonsmatrisen for alle INSE items og insecurity

inse <- select(stressdata, contains("INSE"))
cor(inse) %>% round(2)

Hvilket item er minst korrelert med summeskåren?

  1. Beregn cronbach’s \(\alpha\) for INSE
psych::alpha(inse[, 1:5])

Hva blir \(\alpha\) hvis vi fjerne det itement fra skalaen som er minst korrelert med summeskåren?

  1. I utgangspunktet fra den tyske originalstudien skulle det være 10 fasetter av digitalt jobbstress. Studien vår finner ikke støtte for dette. Vi fant støtte for 8 fasetter. Hvilke to fasetter av digital jobbstress fant vi ikke støtte for i det norske utvalget?

  2. Logistisk regresjon. Bruk stressdataene til å predikere kjønn ut ifra bransje og leder (to binære prediktorer). Du må gjøre kjønn om til 0/1 (1 =kvinne) først:

stressdata$kvinne <- ifelse(stressdata$kjønn=="mann", 0, 1)
  1. Tolk koeffisientene i forrige oppgave, gjerne som prosentvis endring i oddsene

  2. Noen kjente tester er

Hvor mange items er det i hvert av disse? Hvilken Likert skala er brukt?

References

Eysenck, Hans J, and Sybil BG Eysenck. 1968. “Eysenck Personality Inventory.” Journal of Clinical Psychology.
Rosenberg, Morris. 1965. “Rosenberg Self-Esteem Scale.” Journal of Religion and Health.
Rotter, Julian B. 1966. “Generalized Expectancies for Internal Versus External Control of Reinforcement.” Psychological Monographs: General and Applied 80 (1): 1.
Spielberger, Charles D. 1983. “State-Trait Anxiety Inventory for Adults.”